Streets networks provide an invaluable source of information about the different temporal and spatial patterns emerging in our cities. These streets are often represented as graphs where intersections are modelled as nodes and streets as links between them. Previous work has shown that raster representations of the original data can be created through a learning algorithm on low-dimensional representations of the street networks. In contrast, models that capture high-level urban network metrics can be trained through convolutional neural networks. However, the detailed topological data is lost through the rasterisation of the street network. The models cannot recover this information from the image alone, failing to capture complex street network features. This paper proposes a model capable of inferring good representations directly from the street network. Specifically, we use a variational autoencoder with graph convolutional layers and a decoder that outputs a probabilistic fully-connected graph to learn latent representations that encode both local network structure and the spatial distribution of nodes. We train the model on thousands of street network segments and use the learnt representations to generate synthetic street configurations. Finally, we proposed a possible application to classify the urban morphology of different network segments by investigating their common characteristics in the learnt space.
translated by 谷歌翻译
估计越野环境中的地形横穿性需要关于机器人和这些地形之间复杂相互作用动态的推理。但是,建立准确的物理模型,或创建有益的标签来以有监督的方式学习模型是有挑战性的。我们提出了一种方法,该方法通过将外部感受性的环境信息与本体感受性的地形相互作用反馈相结合,以自我监督的方式将遍历性成本映像结合在一起。此外,我们提出了一种将机器人速度纳入Costmap预测管道中的新型方法。我们在具有挑战性的越野地形上,在多个大型,自动的全地形车辆(ATV)上验证了我们的方法,并在单独的大型地面机器人上易于集成。我们的短尺寸导航结果表明,使用我们学到的Costmaps可以使整体航行更顺畅,并为机器人提供了对机器人与不同地形类型(例如草和砾石)之间相互作用的更细粒度的了解。我们的大规模导航试验表明,与基于占用率的导航基线相比,我们可以将干预措施的数量减少多达57%,这是在挑战400 m至3150 m不等的越野课程中。
translated by 谷歌翻译
部署AI驱动的系统需要支持有效人类互动的值得信赖的模型,超出了原始预测准确性。概念瓶颈模型通过在类似人类的概念的中间级别调节分类任务来促进可信度。这使得人类干预措施可以纠正错误预测的概念以改善模型的性能。但是,现有的概念瓶颈模型无法在高任务准确性,基于概念的强大解释和对概念的有效干预措施之间找到最佳的妥协,尤其是在稀缺完整和准确的概念主管的现实情况下。为了解决这个问题,我们提出了概念嵌入模型,这是一种新型的概念瓶颈模型,它通过学习可解释的高维概念表示形式而超出了当前的准确性-VS解关性权衡。我们的实验表明,嵌入模型(1)达到更好或竞争性的任务准确性W.R.T. W.R.T.没有概念的标准神经模型,(2)提供概念表示,以捕获有意义的语义,包括其地面真相标签,(3)支持测试时间概念干预措施,其在测试准确性中的影响超过了标准概念瓶颈模型,以及(4)规模对于稀缺的完整概念监督的现实条件。
translated by 谷歌翻译
我们分析了一个随机近似算法的决策依赖性问题,其中算法沿迭代序列演变的数据分布。此类问题的主要示例出现在表演预测及其多人游戏扩展中。我们表明,在温和的假设下,算法的平均迭代和溶液之间的偏差在渐近正常上,协方差很好地解除了梯度噪声和分布移位的影响。此外,在H \'Ajek和Le Cam的工作中,我们表明该算法的渐近性能是本地最小的最佳选择。
translated by 谷歌翻译
递归是有限地描述潜在无限物体的基本范例。由于最先进的强化学习(RL)算法无法直接推理递归,因此他们必须依靠从业者的创造力来设计适当的“平坦”环境代表。由此产生的手动特征结构和近似值繁琐且容易出错。他们缺乏透明度会阻碍可伸缩性。为了克服这些挑战,我们开发了能够在被描述为Markov决策过程集合(MDP)的环境中计算最佳策略的RL算法,这些算法可以递归调用。每个成分MDP的特征是几个进入点和出口点,与这些调用的输入和输出值相对应。这些递归的MDP(或RMDPS)与概率下降系统(呼叫堆栈扮演起作用堆栈的角色)相同,并且可以用递归程序性调用对概率程序进行建模。我们介绍了递归Q学习 - RMDPS的无模型RL算法 - 并证明它在轻度假设下会收敛于有限的,单位和确定性的多EXIT RMDP。
translated by 谷歌翻译
我们报告了我们在解决20号长度和宽度的问题方面的成功。。
translated by 谷歌翻译
人类的文化曲目依赖于创新:我们连续和层次上探讨如何将现有元素组合起来创建新的能力。创新不是孤独的,它依赖于以前解决方案的集体积累和合并。机器学习方法通​​常假定完全连接的多代理网络最适合创新。然而,人类实验室和现场研究表明,动态沟通拓扑可以更强大地实现等级创新。在动态拓扑结构中,人类在单独或小簇中进行创新之间振荡,然后与他人分享结果。据我们所知,在机器学习中,尚未系统地研究多代理拓扑在创新中的作用。目前尚不清楚a)哪些交流拓扑对于哪些创新任务以及b)共享经验的特性改善了多级创新的最佳选择。在这里,我们使用三个不同的创新任务,使用多级分层问题设置(WordCraft)。我们系统地设计了DQNS的网络,分享了他们在不同拓扑(完全连接,小世界,动态,戒指)中共享其重播缓冲区的体验。比较不同任务的不同经验共享拓扑实现的创新水平,这表明,首先,与人类的发现一致,在动态拓扑中共享的经验可以达到整个任务的最高创新水平。其次,当有一条清晰的创新途径时,经验共享并不那么有用。第三,我们提出的两个指标,共享经验的合规性和多样性可以解释不同任务上不同拓扑的成功。这些贡献可以促进我们对最佳AI-AI,人类和人类协作网络的理解,从而激发未来的工具来促进大型组织的集体创新。
translated by 谷歌翻译
近年来,通过提取基于规则的模型,提高了深度神经网络(DNN)的可解释性和调试性,这一直有很大的努力,该模型近似于其决策边界。然而,当前DNN规则提取方法在提取DNN的潜在空间时,当提取称为分解算法时,要么限制为单层DNN或难以称为DNN或数据的大小。在本文中,我们通过介绍EclaIRE来解决这些限制,这是一种能够缩放到大型DNN架构和大型训练数据集的新型多项式规则提取算法。我们在各种任务中评估乳房,从乳腺癌预后到粒子检测,并表明它一直提取比当前最先进的方法提取更准确和可理解的规则集,同时使用数量级的计算资源。我们通过开源混音库(https://github.com/mateoespinosa/remix),使我们的所有方法包括规则集可视化接口,包括规则集可视化接口。
translated by 谷歌翻译
我们调查与高斯的混合的数据分享共同但未知,潜在虐待协方差矩阵的数据。我们首先考虑具有两个等级大小的组件的高斯混合,并根据最大似然估计导出最大切割整数程序。当样品的数量在维度下线性增长时,我们证明其解决方案实现了最佳的错误分类率,直到对数因子。但是,解决最大切割问题似乎是在计算上棘手的。为了克服这一点,我们开发了一种高效的频谱算法,该算法达到最佳速率,但需要一种二次样本量。虽然这种样本复杂性比最大切割问题更差,但我们猜测没有多项式方法可以更好地执行。此外,我们收集了支持统计计算差距存在的数值和理论证据。最后,我们将MAX-CUT程序概括为$ k $ -means程序,该程序处理多组分混合物的可能性不平等。它享有相似的最优性保证,用于满足运输成本不平等的分布式的混合物,包括高斯和强烈的对数的分布。
translated by 谷歌翻译
本文考虑了一个规范聚类问题,其中一个人从两个椭圆分布的平衡混合物中获取未标记的样本,并旨在估计标签的分类器。许多流行的方法包括PCA和K-Meanse需要混合物的各个组分在稍微球形,并且在拉伸时表现不佳。为了克服这个问题,我们提出了一个非凸面的程序寻求仿射变换,将数据转换为一维点云集中在$ -1 $和1美元之后,之后群集变得容易。我们的理论贡献是两倍:(1)我们表明,当样品大小超过维度的一些恒定倍数时,非凸损耗功能表现出理想的几何特性,以及(2)我们利用这一点,以证明这是一个有效的第一 - 订单算法在没有良好的初始化的情况下实现了近最佳统计精度。我们还提出了一般的方法,用于聚类,具有灵活的特征变换和损失目标。
translated by 谷歌翻译